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Abstract of DE1 971 0252 

The processing system 11 has a number of parallel processors 12. Instruction routine execution data is 
collected 1 3 and used to generate a processing profile in the form of a series of reports This allows the 
various routines to be classified. The execution time data is summed 14 and a statistical evaluation made. 
A graphical representation is made that shows maximum, minimum, average and standard variation of the 
execution times of the routines. 
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Prufungsantrag gem. § 44 PatG ist gestellt 

(3) Verfahren zur sichtbaren Darstellung von Ergebnissen der Leistungsuberwachung und -Analyse in einem 
Parallelrechnersystem 

(§) Es wird ein Verfahren der sichtbaren Darstellung von 

Ergebnissen der Leistungsuberwachung und -analyse fur ein 

Parallelrechnersystem beschrieben, bei dem eine Vielzahl 

von Prozessoren ein parallel verarbeitendes Programm aus- 

fuhren, welches aus einer Vielzahl von Routinen zusammen- 

gesetzt ist. Zuerst werden Informationen hinsichtlich der 

Ausfuhrungszeit von jeder Routine in einer Realzeitweise 

gesammelt, wahrend das Programm gleichlaufend durch die 

Vielzahl von Prozessoren ausgefuhrt wird. Zweitens werden 

Maximal-, Mittel- und Minimalwerte der Ausfuhrungszeit 

von jeder Routine berechnet, basierend auf den Informatio- 
nen, die fur die Vielzahl der Prozessoren gesammelt wurden. 

Drittens werden die gesammelten Informationen in Form 

eines Ausfuhrungsprofils zusammengefaBt oder summiert 
^ und werden in graphischer Form dargestetit, und zwar unter 

Verwendung von Balkengraphiken, Kreisgraphiken oder Ra- 

darkarten. Fur jede Prozedur oder Programmschieife klassifi- 
Lf> ziert das voriiegende Verfahren die Prozentsatze der Anwen- 
CM der-Netto-Programmausfuhrung, Kommunikation, Synchro- 
O nisation und anderer parallel laufender Zusatzaufgaben, und 
«™ zeigt auch deren Abweichungen an. Dieses Merkmal unter- 

stutzt den Anwender darin, das aktuelle Programmverhalten 
0> zu verstehen und das parallel verarbeitende Programm 

abzustimmen. 

LU 
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H1NTERGRUND DER ERFINDUNG 
1. Gebiet der Erfindung 

Die vorliegende Erfindung betrifft ein Verfahren zur sichtbaren Darstcllung von Ergebnissen der Leistungs- 
uberwachung und -analyse in einem Parallelrechnersystem, welches eine Vielzahl von Prozessoren verwendet, 
io und betrifft spezieller ein Verfahren zur sichtbaren Darstellung von Ergebnissen der Leistungsuberwachung und 
-analyse in einer bedienungskorafortableren und urafassenden Weise. Die vorliegende Erfindung betrifft auch 
ein computer-lesbares Medium, welches mit einem Computerprogramm codiert ist, bei welchem das zuvor 
genannte Verfahren realisiert wird 

15 Z Beschreibung des verwandten Standes der Technik 

Parallele Verarbeitungstechniken spielen eine entscheidende Rolle bei der Befriedigung von heutzutage 
wachsenden Anforderungen nach Hochleistungsrechnersystemen. Ein Parallelrechnersystem fuJirt eine Anwen- 
dung aus, indem es eine Vielzahl von Prozessoren verwendet, die parallel laufen, wodurch ein hoher Verarbei- 
tungsdurchgang erzielt wird. Die Entwicklung von Software fur ein Paralielrechnersystera bringt jedoch im 
allgeraeinen einige Schwierigkeiten bei der Programmaustestung, Bewertung und Leistungsabstunmung mit 
sich,undzwaraufgrundderenkoraplexerNatur. 

Urn das Problem zu Idsen, werden Leistungsanalysierer als ein gunsttges Werkzeug eingefuhrt, welches die 
Software-Programmierer darin unterstutzt, das Verhalten eines Parallelprogramms beimTesten zu uberwachen 
und dessen Leistung zu raessen, Der Analysierer verarbeitet die gesammelten Daten und prasentiert das 
Ergebnis dera Anwender in Form eines aufsuramierten Ausfuhrungsprofils. 

Ein herkommlicher Leistungsanalysierer erzeugt ein AusfQhrungsprofil von einzelnen Prozessoren, welches in 
solcher Weise aufsuinmiert ist, daB die gesamte Verarbeitungszeit in einige Kategorien klassifiziert ist, enthal- 
tend Netto-Betriebszeit und Leeriaufzeit usw. Das Aiisfuhrungsprofil jedes Prozessors wird getrennt in Form 
30 einer Balkengraphik oder ahnlichem dargestellt. 

Dieses herkommliche Verfahren der Darstellung von Ausfuhrungsprofilen ist jedoch fur Software-Entwick- 
lungsingenieure in keiner Weise vorteilhaft, wenn das Parallelverarbeitungssystem hunderte von Prozessoren 
enthalt Die an einem Analyrierer-Bildschirm dargestellten Informationen sind zu umfangreich, urn das Pro- 
grammverhalten richtig verstehen zu konnen, da zu viele Prozessoren parallel laufen. In einem solchen Fall kann 
as der herkommliche Analysierer die Schwierigkeit dadurch etwas mildern, indem eine gewisse statisrische Verar- 
beitung hinsichtlich der gewonnen Rohdaten angewandt wird Dies eriaubt es, das Gesamtprogrammverhalten 
oder die mittlere Leistung der Prozessoren den Ingenieuren in einer verstandlicheren Art darzubieten. 

Jedoch sind die Informationen, die durch diesen herkommlicheri Leistungsanalysierer vorgesehen werden, fur 
die Software-Entwicklungsingenieure nicht ausreichend, urn die Systemqualhat bzw. Leistung voUst§ndig ver- 
40 stehen zu konnen und die detaillierte Beziehung zwischen den Prozessen verstehen zu kdnnen, die parallel 
laufen. 

ZUSAMMENFASSUNG DER ERFINDUNG 

Unter Einbeziehung des oben gesagten, besteht eine erste Aufgabe der vorliegenden Erfindung darin, ein 
verbessertes Verfahren zur sichtbaren Darstellung von Ergebnissen der Leistungsuberwachung und -analyse in 
einem Parallelrechnersystem zu schaffen, welches Prozentsatze der Anwender-Netto-Pn>grammausfuhrung, 
Kommunikation, Synchronisation und anderer parallel ablauf ender Organisationsaufgaben zeigt als auch deren 
Abweichungen anzeigt 

Es ist ein weiteres Ziel der vorliegenden Erfindung, ein verbessertes Verfahren zur sichtbaren Darstellung von 
Ergebnissen der Leistungsuberwachung und -analyse in einem Parallelrechnersystem zu schaffen, welches dem 
Anwender die Moglichkeit bietet, Software-Routinen in einem parallel verarbeitenden Programm zu bewerten, 
und zwar uber eine problemlose und vorteilhafte graphische Wiedergabe des Ausfuhrungsprofils. 

Um die genannte Aufgabe zu ldsen, schafft die vorliegende Erfindung ein Verfahren zur sichtbaren Darstel- 
lung von Ergebnissen der Leistungsuberwachung und -analyse in einem ParaDelrechnersystem, bei dem eine 
Vielzahl von Prozessoren ein paralleles Verarbeitungsprogramm ausfuhren, welches aus einer Vielzahl von 
Routinen zusamraengesetzt ist Das Verfahren umf afit die folgenden Schritte: 

(a) Sammeln von Informationen hinsichtlich der Ausfuhrungszeit von jeder Routine, die gleichlaufend durch 
eine Vielzahl von Prozessoren ausgefuhrt wird unter Berucksichtigung der Klassifizierung der Routinen; 

(b) Ableiten eines Maximalwertes, eines Mittelwertes, eines Minimahvertes und einer Standardabweichung 
der Ausfuhrungszeit von jeder Routine basierend auf den Informationen, die fur die Vielzahl der Prozesso- 
ren gesammelt wurden; und 

(c) graphisches Darstetlen der AusfQhrungsprofil- Information, welche den Maximalwert, den Mittelwert 
und den Minimaiwert und die Standardabweichung der Ausfuhrungszeit jeder Routine enthalt 

Um speziell das weitere ZieU welches oben erlautert wurde, zu erreichen, wird ein Verfahren zur sichtbaren 
Darstellung von Ergebnissen der Leistungsuberwachung und -analyse fur ein Parallelrechnersystem geschaffen. 
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GeraaB dem Verfahren werden Ausfuhrungsprofil-Inforraationen in Form von Balkengraphiken, Kreisgraphi- 
ken oder Radarkarten dargesteilt 

Weitere ZieJe neben den obigen, MerkniaJe und VorteiJe der vorliegenden Erfindung ergeben sich aus der 
folgenden Beschreibung in Verbindung rait den beigefGgten Zeichnungen, die eine bevorzugte Ausfuhrungsforra 
der vorliegenden Erfindung aJs Beispiel veranschaulichen. 5 

KURZBESCHREIBUNG DER ZEICHNUNGEN 

Fig. 1 ist eine Konzeptdarstellung eines Leistungsanalysierersystems, welches ein Sichtdarstellungsverfahren 
gemaB der vorliegenden Erfindung verwendet; 10 

Fig. 2 ist ein FluBdiagramm, welches einen ProzeB der ModiHzierung und Kompilierung eines Programras 
zeigt, welches fur ein Parallelverarbeitungssystem geschrieben wurde; 

Fig. 3 ist eine Tabelle, in der Laufzeit-Subroutinen aufsummiert sind, die fur eine Leistimgsuberwachung und 
-analyse vorgesehen werden; 

Fig. 4 ist ein FluBdiagramm, welches die Funktionen der Laufzeit-Subroutine # 1 beschreibt; 

Fig. 5 ist ein FluBdiagramm, welches die Funktionen der Laufzeit-Subroutine # 2 beschreibt 

Fig. 6 ist ein FluBdiagramm, welches die Funktionen der Laufzeit-Subroutine # 3 beschreibt 

Fig. 7 ist ein FluBdiagramm, welches die Funktionen der Laufzeit-Subroutine # 4 beschreibt; 

Fig. 8 ist ein FluBdiagramm, welches die Funktionen der Laufzeit-Subroutine # 5 beschreibt; 

Fig. 9 ist ein FluBdiagramm, welches die Funktionen der Laufzeit-Subroutine # 6 beschreibt; 

Fig. 1 0 ist ein FluBdiagramm, welches die Funktionen der Laufzeit-Subroutine tt 7 beschreibt, 

Fig. 11 ist ein FluBdiagramm, welches die Funktionen der Laufzeit-Subroutine #8 beschreibt; 

Fig. 12 ist eine Tabelle, in der die Informationen aufsummiert sind, die durch das Leistungsanalysierersystera 
der vorliegenden Erfindung zu sammeln sind; 

Fig. 13 ist ein Diagramm, welches ein erstes Beispiel einer Ausfuhrungsprofllanzeige gemaB der vorliegenden 25 
Erfindung zeigt, bei der jede Prozedur oder Schleif e skaliert ist in bezug auf die Ausfuhrungszeit eines gesamten 
Programms; 

Fig. 14 ist ein Diagramm, welches ein zweites Beispiel der Ausfuhrungsprofildarstellung zeigt, bei der alle 
Prozeduren und Schleifen in gleicher Weise skaliert sind, ungeachtet deren absoluter Ausfuhrungszeit en; 

Fig. 15 ist ein Diagramm, welches ein drittes Beispiel einer Ausfuhrungsprofildarstellung zeigt, in der das 30 
Ausfuhrungsprofil von jeder Prozedur oder Schleife in einer Kreisgraphik wiedergegeben ist; 

Fig. 16 ist ein Diagramm, welches ein viertes Beispiel der Aushlhrungsprofildarstellung zeigt, in der das 
Ausfuhrungsprofil in einer Radarkarte wiedergegeben ist; 

Fig. 17 ist ein Diagramm, welches ein funftes Beispiel einer Ausfuhrungsprofildarstellung gemaB der vorlie- 
genden Erfindung zeigt; und 35 

Fig. 18 ist ein Diagramm, welches ein sechstes Beispiel der Ausfuhrungsprofildarstellung gemaB der vorlie- 
genden Erfindung zeigt 



BESCHREIBUNG DER BEVORZUGTEN AUSFOHRUNGSFORM 
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Eine Ausfuhrungsform der vorliegenden Erfindung soli nun ira folgenden unter Hinweis auf die beigefugten 
Zeichnungen beschrieben werdea 

Fig. 1 ist eine Konzeptdarstellung eines Leistungsanalysierersystems, in welchera ein Sichtbardarsteilverfah- 
ren gemaB der vorliegenden Erfindung angewandt wird. Ein Parallelrechnersystem 1 1 ist durch eine Vielzahl von 
Prozessoren 12a— 12n aufgebaut, die als Berechnungselemente dienen und die zusammen iaufen, urn umfangrei- 45 
che Berechnungsaufgaben zu erzielen, die in einera Parallelverarbeitungsprogramm codiert sind. Solche Prozes- 
soren 12a— 12n umfassen einzeln Datensammeleimichtungea 13a— 13n und eine Datensummiereinrichtung 
14a — 14n zum Korrigieren und Aufsummieren von jeweils Ausfimrungszeitdaten. 

Die Datensammeleinrichtungen 13a— 13n sammeln in einer Real zeitweise die Ausfuhrungszeitdaten wahrend 
der Programmausfuhrung in den jeweiligen Prozessoren 12a— 12n, in denen sie auftreten. Die Ausfuhrungszeit- so 
datcn, die durch die Datensammeleinrichtungen I3a— 13n gesammelt wurden, werden als Quellendaten fur die 
Ausfuhrungsprofile verwendet Die Ausfuhrungsprofile bestehen aus einem Satz von Reports, welche die 
Anwender mit Informationen iiber die Prozessoren 12a— 12n, daB diese tatsachlich arbeiten, versehen, wodurch 
diese das Programm von verschiedenen Gesichtspunkten aus bewerten konnen. 

Die Ausfuhrungsprofile weisen auf einige bestiramte Programmroutinen hin, welche das Parallelverarbei- ss 
tungsprograram bilden, wie beispielsweise Prozeduren, Schleifen, eine parallele Verarbeitungsbibliothek, die 
durch das LeistungsahaJysierersystem uberwacht und anaiysiert werden. In diesem Sinn werden diese Routinen 
als Subjekte der Profilbildung oder Profiisubjekte bezeichnet 

Die Datensummiereinrichtungen 14a— 14n summieren die Ausfuhrungszeitdaten, die durch die Datensammel- 
einrichtungen 13a- 13n gesammelt wurdea Spezifisch gesagt, berechnen sie Maximal-, Mittel-, Miniraalwerte 60 
und eine Standardabweichung der gesammelten Ausfuhrungszeit en fur jede Routine oder jedes Subjekt fur die 
Profilbildung. Urn diese Aufgabe zu erreichen, ist es erforderlich, alle Ausfuhrungszeitdaten zu kompilieren, die 
durch die Datensammeleinrichtungen 13a— 13n an einer einzelnen Stelle gesammelt wurden. Daher befaBt sich 
eine der Datensummiereinrichtungen, wie beispielsweise 14$, mit den Summierungsaufgaben und andere 
14b— 14n senden einfach ihre Daten zu dieser Datensummier-Subroutine 14a unter Verwendung von Inter-Pro- ss 
zessor-Komraunikationspfaden (nicht gezeigt) in dem Parallelrechnersystem 1 1. 

In Wirklichkeit sind die oben beschriebenen Datensammeleinrichtungen 13a— 13n und die Datensummierein- 
richtungen t4a— 14n in dem Parallelrechnersystem 11 in Form eines Satzes von Subroutinen implementiert, die 



als ein Teil der Laufzeitbibliothek fur die Parallelverarbeitung vorgesehen sind. Bei der vorliegenden Ausfuh- 
rungsform stehen acht Laufeeit-Subroutinen fur diesen Zweck zur Verfugung, wic in Fig. 3 aufgehstet ist Die 
detaillierten Funktionen der Datensammeleinrichtungen 13a- 13n und der Datensumrmereinnchtungen 
14a _ t4 n so »en getrennt unter Hinweis auf die Fig. 4 bis II beschrieben werden. 
5 Urn erneut auf Fig. 1 einzugehen, ist das Parallelrechnersystera 11 an zwei Datendateien gekoppelt: erne 
Quellencodedatei 15 und eine Profilinformationsdatei 16. Die Quellencodedatei 15 enthait den onginalen Quel- 
lencode eines Programms, welches durch die Prozessoren 12a- 12n ausgefOhrt werden sol Die Profilinforma- 
tionsdatei 16 speichert AusfGhrungszeitdaten und deren Summendaten, wie sie von den Prozessoren 12a- 12n 
benotigt werden. 

l0 Ein Profilanzeigeprozessor 17 analysiert die Inhaite der ProfiUnformationsdatei 16 und stellt das Ergebnis 
dieser Analyse in einera Ausfuhrungsprofilfenster 22 auf einera Bildschirm einer Anzeigeeinheit 21 dar. Hier 
macht der Profilanzeigeprozessor 17 das Ergebnis der Analyse sichtbar, und zwar unter Verwendung rnehrerer 
graphischer Wiedergabetechniken, wie dies an spaterer SteUe in Verbindung mit den Fig. 13 bis 18 besctaeben 
werden solL Eine Eingabevorrichtung 18 wird dazu verwendet um einige Bef ehle oder Daten in den Protilanzei- 
15 geprozessor 17 einzugeben. . 

Bei Verwendung dieser Eingabevorrichtung 18 kann der Anwender dieses Uistungsanarysierersystems emen 
spezifischen Punkt (z. B. eine Prozedur oder Schleife) bezeichnen, der in dem Ausfuhrungsprofilfenster 22 
dargestellt wird Ein Quellencode-Positionsanalysierer 19 sucht nach dem Quellencode, um die Codeposition 
(oder Zeilenzahl) entsprechend dem Punkt herauszufinden, der durch den Anwender bezeichnet worden ist 
M GemaB der (Deposition-Information, die durch den Quellencode-Positionsanalysierer 19 geliefert wird, extra- 
hiert einen Quellencode- Browser 20 den relevanten Teil des Quellencodes 15 und zeigt den extrahierten 
Quellencode in einera Quellencodefenster 23 auf dem Bildschrift der Anzeigeeinheit 21 an. 

Bevor die Programraausfuhning bei dem oben beschriebenen System gestartet wird, ist es erforderlich, den 
originalen Quellencode in ein ausf iihrbares Programm zu ubersetzen oder zu kompilieren. Bei der vorliegenden 
Erfindung sollte der Quellencode vor der Kompiliening raocUTiziert werden, und zwar fur Oberwachungs- und 
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MeBzwecke. Spezifischer gesagt schiebt das Kompiliersystem Subroutine-Ruf-Zustande m den Quellencode ein, 
ura einige Laufzeit-Subroutinen fur die Datensammlung und Summierung an geeigneten Punkten ui dem 
Programm aufzuruf en- . _ _ 

Der Quellencode eines parallel verarbeitenden Programms besitzt eine merarcmsche Struktur. Das Pro- 
30 gramm oder die Anwender-Anwendung besteht aus einer Vielzahl von Prozedurea Eine Prozedur ruft einige 
andere Prozeduren auf; mit anderen Worten konnen Prozeduren verschachtelt werden. Als Tatsache ist der 
Hauptkorper des Programms eine Prozedur, die implizit als "MAIN" bezeichnet wird, die mehrere Abkdmm- 
lingsprozeduren enthait Die Schleife besteht aus einer Sequenz von Befehlen als Tefl einer Prozedur, die iterativ 
ausgefOhrt werden. 

35 Um die paralle Programmausfuhrung zu unterstutzen, sieht das System eine Bibliothek von Routmen von um 
eine ProzeBkoramunikation, Synchronisation und andere Aufgaben auszufuhren, die bei der parallelen Verarbei- 
tung inharent vorkommen. Diese werden als parallel verarbeitende Bibliotheksroutinen bezeichnet, welche 
durch die Prozeduren nach Bedarf aufgerufen werden. Da sie die Systemleistung als parallel laufende Zusatze 
beeinflussen, sind die parallel verarbeitenden BibUotheksroutinen ein wichtiges Merkmal bei der Ausfuhrung der 
40 Profilbildung. . 

Fig. 2 zeigt ein FluBdiagramm, welches einen ProzeB der Modifizierung und Kompflierung eines Programms 
fQr das Parallelrechnersystera 1 1 zeigt Dieser ProzeB enthait die folgenden sieben Schritte, 

[SI] Es wird der Quellencode eines parallel verarbeitenden Programms, welches in jedem Prozessor in dem 
Parallelrechnersystera 1 1 auszufuhren ist in das Kompilierungssystem eingegeben. 

[S2] Es wird eine Feststellung zum Aufrufen einer Laufzeit-Subroutine # 1 in den Anfangsteil des Hauptpro- 
grammkorpers eingefugt Die Laufzeit-Subroutine * 1 zeichnet die Zeit auf, wenn das Programm gestartet wird. 

[S3] Es werden Feststellungen zum Aufrufen der Laufzeit-Subroutinen #2 und #3 jeweils in den Anfangsteil 
und in den Endteil jeder Prozedur eingefugt, die in dem Quellencode enthalten ist 
[S4] Es werden Feststellungen zum Aufrufen der Laufzeit-Subroutinen #4 und #5 jeweils in den Anfangsteil 
so und in den Endteil jeder Schleife eingefugt; die in den Prozeduren enthalten ist 

[S5] Es werden Feststellungen zum Aufrufen der Laufzeit-Subroutinen # 6 und #7 jeweils in den Anfangsteil 
und in den Endteil jeder parallel verarbeitenden Bibliotheks routine eingefugt 

[S6] Es wird eine Feststellung zum Aufrufen der Laufzeit-Subroutine #8 in den Endteil des Hauptprograrara- 
korpers eingefugt # . . 

55 [S7] Das Kompilierungssystem ubersetzt (oder korapiliert) die Quellencodedatei 15, die nun die bei den 
Schritten S2 bis S6 eingefQgten Subroutme-Aufruf-FeststeUungen enthait, in den Objektcode, der durch die 
Prozessoren 12a— 12n aushlhrbar ist . . 

Durch Ausfuhren der oben erlauterten Schritte SI bis S7 fQgt das Kompilierungssystem emige geeignete 
Feststellungen in die Quellencodedatei 15 ein, um die Laufzeit-Subroutinen fur die Datensammlung und Aufsum- 
60 mierung aufzurufen und es kompiliert die Quellencodedatei 15, um den ausfuhrbaren Objektcode zu generieren. 
Als ein Ergebnis enthait der generierte Objektcode Subroutine-Aufruf-Befehle sowohl an den Start- als auch 
Endpunkten des Hauptprogrammkorpers, der Prozeduren, Schleifen und der parallel verarbeitenden Bibhot- 
heksroutinen. 

Fig. 3 faBt die Laufzeit-Subroutinen, die zum Zweck der LeistungsQberwachung und -analyse eingefunrt 
65 wurden, zusammen. Die Tabelle 30 beschreibt kurz die Funktionen der acht Laufzeit-Subroutinen in deren 
je weiligen Gelegenheiten, bei denen sie aufgerufen werden 

Die in dieser Tabelle aufgelisteten ersten sieben Subroutinen (# 1 bis #7) sind Subroutinen, die zum Santmeln 
von Zeitwertzeichendaten und zum Akkumutieren der Ausfuhrungszeit von jedem Abschnirt des Parallelpro- 
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gramms ausgelegt sind Das heiBt, solche Subroutinen #1 — #7 entsprcchend dcr Datensamraeleinrichtung 
13a- 13n in Fig. 1. Die achte Subroutine #8 besteht aus einer Subroutine, die zum Summieren der Daten 
ausgelegt ist, die durch die Subroutinen # 1 bis 4* 7 gesammelt und akkumuliert wurden. Die Subroutine #8 
entspricht sorait der Datensununiereinrichtung 14a— 14n. 

Ura auf die Fig. 4 bis 11 einzugehen, so das folgende hinsichtlich der detaillierten Funktionen der Laufzeit- s 
Subroutinen # 1 - # 8 erlautert, die in den Quellencode eingefugt sind 

Fig. 4 zeigt ein FluCdiagramm, welches die Laufzeit-Subroutine # 1 zeigt, die dann aufgerufen wird wenn das 
Prograram startet zu lauf en und die zwei folgenden Aufgaben vorsieht 

[Si I a] Initialisieren eines ortlichen Datenbereiches, der zura Aufzeichnen und zum Analysieren des Prozessor- 
Verhaltens verwendet wird io 

[S 1 1 b] Aufzeichnen des Program mstartzehpunktes. 

Die Fig. 5 und 6 sind FluBdiagramme, welche die Laufzeit-Subroutinen #2 bzw. #3 zeigen. Die Laufzeit-Sub- 
routine #2 wird zu Beginn von jeder Prozedur aufgerufen und wie bei dem Schritt S12a von Fig. 5 gezeigt ist, 
zeichnet sie den Ausfuhrungsstartzeitpunkt dieser Prozedur auf. Als ein Gegenstuck zu dieser Subroutine #2 
wird die Laufzeit-Subroutine #3 aufgerufen, wenn die Prozedur beendet wird und sie fuhrt die folgenden drei is 
Aufgaben aus: 

[S13a] ErhaJten der Ausnlhrungs-Ende-Zeit der Prozedur. 

[S13b] Akkumulieren der Ausfuhrungszeit der Prozedur (das heiBt Akkumulieren der Differenz zwischen der 
Ausf uhrungsstartzeit und der AusfOhrungs-Ende-Zeit^ 

[S13cJ Akkumulieren der AusfQhrungszeit von jeder parallel verarbeitenden Bibliotheksroutine, die durch die 20 
Prozedur aufgerufen wurde (das heiBt Akkumulieren der Differenz zwischen der Ausfuhrungsstartzeit und der 
AusfuJining-Ende-Zeit, die durch die Laufzeit-Subroutinen #6 und #7 fur jede parallel verarbeitende Bibliot- 
heksroutine auf gezeichnet wurde). 

Fig. 7 zeigt ein FluBdiagramra der Laufzeit-Subroutine #4, welche aufgerufen wird wenn der Prozessor in 
eine Schleife eintritt Die Schleife urafaBt eine Folge von Befehlen, die iterativ ausgefuhrt werden, und zwar 25 
unter der Steuerung einer Schletfen-Zahler- Variablen. Jedesrnal wenn die Schleife ausgefuhrt wird wird die 
Schleifen-Zahler- Variable erhoht (oder vermindert), und zwar ura ein vorbestimmtes Inkreroent und es wird die 
Schleife wiederholt, bis die Schleifen-Zahler- Variable einen vorgeschriebenen Grenzwert erreicht oder andere 
Beendigungsbedingungen erf Gilt sind Ura statistische AusfQhrungsdaten far die Schleifen zu samraeln, fuhrt die 
Laufzeit-Subroutine #4 die folgenden zwei Aufgabeadurch: 30 
[S 14a] Aufzeichnen der Ausfuhrungsstartzeit der Schleife. 

[S14b] Erhalten des Anfangswertes der Schleifen-Zahler- Variablen und des Inkrements (oder Schleifenzahler- 
SchrittgroBe) fur jede Iteration, und Aufbewahren derseiben fur zukunftige Verwendung. 

Fig. 8 zeigt ein FIuBdiagramm der Laufzeit-Subroutine #5, die ausgefuhrt wird, wenn eine Schleife beendet 
wird Diese fullt die folgenden vier Aufgaben far jede Schleife. 3$ 
[S15a] Erhalten der Ausfuhrung-Ende-Zeit der Schleife. 

[S15b] Akkumulieren der Ausfuhrungszeit der Schleife (das heiBt Akkumulieren der Differenz zwischen der 
Ausfuhrungsstartzeit und der Ausfuhrung-Ende-Zeit f Or die Schleife). 

[Sl5c] Erhalten des endgultigen Wertes der Schleifensteuer- Variablen und Berechnen der Zahl der Iterationen 
basierend auf den Anfangs- und Endwerten der Schleifen-Zahler- Variablen und der Schritt groBe. 40 
[S15d] Akkumulieren der Zahl der Iterationen. 

[S15e] Akkumulieren der Ausfuhrungszeit von jeder parallel verarbeitenden Bibliotheksroutine, die durch die 
Schleife aufgerufen wird Hier wird die Ausfuhrungszeit dadurch erhalten, indem die Ausfuhrungsstartzeit bzw. 
Ausfuhrungsstartzeitpunkt von dem Ausfuhning-Ende-Zehpunkt subtrahiert wird die durch die Laufzeit-Sub- 
routinen #6 und #7 fur jede parallel verarbeitende Bibliotheksroutine auf gezeichnet wurden, die von der 45 
Schleife aufgerufen wurden. 

Die Fig. 9 und 10 zeigen die Laufzeit-Subroutinen #6 und #7, die aufgerufen werden, wenn eine parallel 
verarbeitende Bibliotheksroutine jewetls startet und endet Das heiBt, die Laufzeit-Subroutine #6 fuhrt den 
folgenden Schritt aus: 

[S16a] Aufzeichnen des Ausfuhrungsstartzeitpunktes der parallel verarbeitenden Bibliotheksroutine. 50 

Als Gegenstuck zu dieser Laufzeit-Subroutine #6 erzeugt die Laufzeit-Subroutine #7 folgendes: 
[SI 7a] Erhalten des Ausfuhnings-Ende-Zeitpunktes der parallel verarbeitenden Bibliotheksroutine. 
[S17b] Akkumulieren der Ausfuhrungszeit der parallel verarbeitenden Bibliotheksroutine, wobei die Ausfuh- 
rungszeit die Differenz zwischen dem Ausfulu-ungsstartzeitpunkt der bei dem Schritt S16a aufgezeichnet wurde, 
und dem Ausfuhrung-Ende-Zeitpunkt, der bei dem Schritt S 1 7a erhalten wurde, ist 55 

Fig. 11 zeigt ein FIuBdiagramm, welches die Laufzeit-Subroutine #8 wiedergibt, die am Ende des gesamten 
Prograrnms ausgefuhrt wird Die Laufzeit-Subroutine #8 summiert die Ausfuhrungszeitdaten auf, die durch die 
anderen Laufzeit-Subroutinen # 1 bis # 7 gesammelt wurden, und zwar gemafi den folgenden Schritten: 
[S18a] Berechnen der mittleren angesamraelt Zeit von jeder parallel verarbeitenden Bibliotheksroutine, die 
durch jede Prozedur aufgerufen wurde, gemaB den folgenden Gleichungen: 60 



Tcp(avg) » Tcp (m) . . . (1) 

n 

Twp(avg) = ^£ Twp (m) .-.(2) 
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Top(avg) = T °P( m ) -.-(3) 



worm n eine ganze Zahl ist, welche die Anzahl der Prozcssorcn wiedergibt, die in dcm Parailelrechnersystera 11 
involviert sind und m eine ganzc Zahl ist, die von i bis n reicht und dazu verwendet wird, urn einen speziflschen 
Prozessor anzuzeigen. Tcp(ra) ist die akkumulierte AusfQhrungszeit, welche der m'te Prozessor fur die Kommu- 
nikationsaufgaben verbraucht hat Tcp(avg) bedeutet eine mittlere angesammelte Ausfuhrungszeit, die fur 
io Kommunikationsaufgaben verbraucht wurde. Twp(m) ist die akkumulierte Ausfuhrungszeit, die der m'te Pro- 
zessor fur die Synchronisation verbraucht hat Twp(avg) bedeutet eine mittlere akkumulierte Ausfuhrungszeit; 
die fur Synchronisationsaufgaben verbraucht wurde. Top(m) ist die akkumulierte Ausfuhrungszeit, die der m'te 
Prozessor fur Auf gaben verbraucht hat, die anders sind als die Koraraunikations- und Synchronisationsaufgaben. 
Top(avg) bedeutet eine mittlere akkumulierte Ausfuhrungszeit, die fur andere Aufgaben verbraucht wurde. 
15 [S18b] Berechnen des Maximalwertes, Minimalwertes und der Standardabweichung a fur jede der akkumulier- 
ten Ausfuhrungszeiten Tcp(ra), Twp(ra) und Top(m). 

[Sl8c] Berechnen der mittleren akkumulierten AusfQhrungszeit des Anwenderprograraras gemaB der folgenden 
Gleichung: 



Tup(avg) = i£ Tup(m) 



«E=1 



worin Tpp(ra) die Ausfuhrungszeit bedeutet, die durch den m'ten Prozessor fur die in Betracht stehende 
Prozedur verbraucht wurde und wobei Tup(m) die Netto- Ausfuhrungszeit des Anwenderprogramms bedeutet 

30 

Tup(ra)-Tpp{m)-Tcp(m)-Twp(ra)-Top(m)) (5) 

[S18d] Berechnen des Maximalwertes, des Minimalwertes und der Standardabweichung a hlr die akkumulierte 
Ausfuhrungszeit des Anwenderprogramms Tup(m). 
35 [S18e] Berechnen der raitderen angesammelten Zeit von jeder parallel verarbeitenden Bibliotheksroutine, die in 
jeder Schleif e aufgeruf en wurde, geraaB den folgenden Gleichungen: 



Tcl(avg) = Tcl(m) ...(6) 

m 

Twl(avg) = ^ Twl (m) -..(7) 

Tol(avg) = |£ Tol (m) ...(8) 



Tcl(m) ist die akkumulierte Ausfuhrungszeit, die der m'te Prozessor fur Kommunikationsaufgaben bendtigt hat 
so Tcl(avg) bedeutet die mittlere angesammelte Ausfuhrungszeit, die fur Kommunikationsaufgaben verbraucht 
wurde. Twl(m) ist die akkumulierte Ausfuhrungszeit, die der m'te Prozessor fur die Synchronisation bendtigt hat 
Tw!(avg) bedeutet die raitdere akkumulierte AusfQhrungszeit, die fur Synchronisationsaufgaben verbraucht 
wurde. Tol(m) ist die akkumulierte Ausfuhrungszeit, die der m'te Prozessor fur Aufgaben verbraucht hat, anders 
als die Koraraunikations- und Synchronisationsaufgaben. Tol(avg) bedeutet die mittlere akkumulierte Ausfuh- 
55 rungszeit, die fur andere Aufgaben verbraucht wurde. 

[S18f] Berechnen des Maximalwertes, des Minimalwertes und der Standardabweichung a fur jede der akkumu- 
lierten Ausfuhrungszeiten Tcl(m), Twt(ra) und Tol(m). 

[S18g] Berechnen der mittleren angesammelten Ausfuhrungszeit des Anwenderprogramms gem§6 der folgen- 
den Gleichung: 



60 



Tul(ave) = i£ Tnl < m) 
65 = x£ (Tpl <m) -Tel (m) -Twl (m) -Tol (m) ) ... (9) 



m=l 
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worm Tpl(m) die Ausfuhrungszeit ist die von dem m'ten Prozessor fur die in Betracht stehende Schleife 
verbraucht wurde und Tu!(m) die akkumulierte Netto- Ausfuhrungszeit des Anwenderprogramms ist 

Tul(ra)-Tpl(ra)-TcI(ni)-.TwI(ra)-Tol(ni)) (5) 

5 

[S18h] Berechnen des Maxim alwertes, des Minimalwertes und der Standardabweichung o fur die akkumulierte 
Ausfuhrungszeit des Anwenderprogramms Tul(ra). 

[S18i] Ausgeben der Ergebnisse der Schritte S18a bis S18h als eine Profil-lnformationsdatei 16. 

Fig. 12 zeigt eine Tabelle, die die Informationen zusammenfaBt, welche durch das Leistungsanafysierersystera 
der vorliegenden Erfmdung gesanunelt wurdea In dieser Tabelle 40 sind die gesammelten Informationen in to 
Einklang mit dem Subjekt der Prordierungsoperationen klassifiziert, welche Prozeduren, Schleifen und parallel 
verarbeitende Bibliotheksroutinen enthalten, ura die Kommunkation, Synchronisation und andere Aufgaben zu 
unterstutzen. Obwohl in Fig. 12 nicht gezeigt konnten bedingte Programmverzweigung auch in dem Profilsub- 
jekt enthalten sein. 

Ira allgemeinen werden Informationen, welche das Programmverhalten in jedera Prozessor betreffen, an drei is 
verschiedenen Stufen der Ausfuhrung gesammelt: einer vorbereitenden Verarbeitungsstuf e, einer Anlauf-Verar- 
beitungsstuf e und einer Datenverarbeitungsstufe (terminal process staged 

Die vorbereitende Verarbeitungsstuf e besteht aus einer Stufe, bevor eine bezeichnete Routine als Profilsub- 
jekt aufgerufen wird. Die drei Arten der Profil-Subjekte, die in der Tabelle 40 aufgelistet sind, erfordern es 
jedoch nicht daB Informationen an der vorbereitenden Verarbeitungsstufe gesammelt werden. Wie oben 20 
dargelegt wurde, konnen auch bedingte Programmverzweigungen (in Fig, 7 nicht gezeigt) ein Ziel der Ausfuh- 
rungsprofilierung sein. Wenn dies der Fall ist werden zusatzliche Befehle in den Queliencode eingefuhrt um eine . 
andere Laufzeit-Subroutine aufzurufen, um Informationen an aktueden Verzweigungsbedingungen zu sarameln. 
Speziell enthalten solche Verzweigungsbedingungen "Wahr- oder Faisch-Ttedingungen als Ergebnis von logi- 
schen Operationen oder "negative, Null- oder positive" Bedingungen als ein Ergebnis von arilhmetischen 2s 
Operationen, die vor den Verzweigungsbefehlen ausgefuhrt wurdea Die Laufzeit-Subroutine zahlt das Auftre- 
ten von jeder solcher Bedingungen, bevor eine Verzweigung durchgef uhrt wird, namlich bei der vorbereitenden 
Verarbeitungsstufe. 

Die Anlauf-Verarbeitungsstufe besteht aus einer Stufe r bei der eine Routine, die bei einem ProfU-Subjekt 
beteiligt ist zu lauf en beginnt Spezieller gesagt wird die Ausfuhrungsstartzeit an der Anlauf-Verarbeitungsstufe 30 
von jeder Prozedur (siehe SI 2a in Fig. 5), Schleife (siehe S 1 4a in Fig. 7) oder parallel verarbeitenden Bibliotheks- 
routine (siehe SI 6a in Fig. 9) aufgezeichnet Ira FaJJe der Schleifen wird der Anfangswert einer Schleifenzahler- 
Variablen und einer SchJeifenzahler-SchrittgroBe zusatzlich zu der Ausfuhrungsstartzeit (siehe S14b in Fig. 7) 
aufgezeichnet 

Die Datenverarbeitungsstufe oder Ende-Verarbeitungsstufe besteht aus einer Stufe, bei der eine Routine 35 
dabei ist zu enden. Bei der Ende-Verarbeitungsstufe jeder Prozedur werden die Ausfuhrungszeit der Prozedur 
und die Ausfuhrungszeit von jeder parallel verarbeitenden Bibliotheks routine, die innerhalb der Prozedur 
aufgerufen wurde, akkumuliert (siehe St 3b und SI 3c in Fig. 6% wodurch die akkumulierten Ausfuhrungszeiten 
Tpp{raX Tcp(m), Twp(m) und Top(m) erhaiten werden. In ahnlicher Weise werden bei der Ende-Verarbeitungs- 
stufe einer Schleife die Ausfuhrungszeit der Schleife und die Ausfuhrungszeit jeder parallel verarbeitenden 40 
Bibliotheksroutine, die innerhalb der Schleife aufgerufen wurde, akkumuliert (siehe S15b und St5e in Fig. 8), 
wodurch die akkumulierten Ausfiihrungszeiten Tpl(m)t Tcl(m), Twl(m) und Tol(m) fur die Schleife erhaiten 
werden. Zusatzlich wird bei der Ende-Verarbeitungsstufe von jeder Schleife die Zahl der Iterationen ebenso 
akkumuliert In bezug auf die parallel verarbeitenden Bibliotheksroutinen wird die Ausfuhrungszeit von jeder 
RoutmebeiderEnde-Verarbeitungsstufe(sieheS17binFig. 10) akkumuliert 45 

Die bei den oben beschriebenen drei ProzeBstufen gesammelten Informationen werden am Ende des Pro- 
gramms summiert und werden dann als eine Profil-Informationsdatei 16 ausgegeben. Zum Wiederauffinden der 
summierten Informationen aus der Profil-Informationsdatei 16 bietet der Profilanzeigeprozessor 17 Ausfuh- 
rungsprofilsummen dem Anwender dieses Systems an. Ura den Anwender mit einer verstandlichen und inforraa- 
tiven Anzeige zu versehen, verwendet der Profilanzeigeprozessor 17 verschiedene DarsteUungsverf ahren, die im 50 
folgenden beschrieben werden. 

Fig. 13 zeigt ein Diagramm, welches ein erstes Beispiel der aus Ausfuhrungsprofilanzeige nach der vorliegen- 
den Erfindung veranschaulicht In diesera Fall bildet die Prozedur *t 1 den Hauptkdrper des unter Test stehen- 
den parallel verarbeitenden Programms und es werden die Balkengraphiken fGr die anderen Prozeduren und 
Schleifen hinsichdich der Ausfuhrungszeit der Prozedur # 1 skaliert (das heiBt die Ausfuhrungszeit des gesanv 55 
ten Programms). 

Die Ausfuhrungsprofilanzeige, die in Fig. 13 veranschaulicht ist enthalt Informationen hinsichtlich der Proze- 
duren #1, #2usw.und hinsichtlich der Schleifen #1, #2 usw.Jede Balkengraphik ist in vierTeile eingeteilt:die 
Anwenderprogramm-AusfuJirungszeit Tu, die KLommunikationsaufgabe- Ausfuhrungszeit Tc, die Synchronisa- 
tionsaufgabe-Ausfuhrungszeit Tw und eine andere Aufgaben-Ausfuhrungszeit To. Die Aufteilung wird durch 60 
den Profilanzeigeprozessor 17 vorgenommen, und zwar im Einklang mit Mittelwerten der angesammelten 
Ausfuhrungszeiten. 

Ferner werden die Ergebnisse der statistischen Analyse fur jede Ausfiihrungszeitkategorie auf den Balkengra- 
phiken uberlagert, wo die minimalen Werte mit einem Sternchenzeichen wiedergegeben sind, die maximalen 
Werte mit einem Symbol V wiedergegeben sind und die Standardabweichungen mit einem horizontalen es 
Liniensegment wiedergegeben sind, welches zwischen diesen gezeichnet ist 

Eine solche gerade Aus- Anzeige der AusfQhrungsstatisriken erlaubt es dem Anwender, in einfacher Weise die 
Beziehung zwischen dem Anwenderprogramm und parallel verarbeitenden Zusatzen, inklusive Kommunika- 



tions- und Synchronisarionsaufgaben zu unterscheiden. Dariiber hinaus kann der Anwender durch das Vorsehen 
der Maximum-, Minimum- und Standardabweichungssymbole auf cincn Blick erkennen, in i welcher Weise die 
Prozentsatze aktueli schwanken. Dieses Merkmal hilft dem Anwender sehr, das Verhalten der Prozeduren und 
Schleifen zu verstehen, die in einera parallel verarbeitenden Programra enthalten sind, so daB dieser die 
Moglichkeit erhalt, zu beobachten, ob das Programm richtig arbeitet oder nicht und die Entscheidung treffen 
kann, ob weitere Programm-Modifikationen erforderlich sind oder nicht, urn eine Qualitatsverbesserung zu 

erreichen. _ . . , 

Fig. 14 zeigt ein Diagramm, welches ein zweites Beispiel der Ausfuhruhgsprofilanzeige wiedergibt Un Oegen- 
satz zu dem ersten in Fig. 13 gezeigten Beispiel werden bei dem Verfahren nach dem zweiten Beispiel alie 
Prozeduren und Schleifen in den individueUen ZeitmaBstaben sichtbar gemacht, ungeachtet von deren absoluten 
Ausfuhrungszeiten. Das heiBt, die Langen der Balkengraphiken sind nicht proportional zu deren jeweiligen 
Ausfuhrungszeidangen. Die Graphiken in Fig. 14 eriauben es jedoch, daB der Anwender auf einfache Weise die 
Prozentsatze der Programrakomponenten verstehen kann (das heiBt Anwenderprogramm Tu, Kommumka- 
tionsaufgabe Tc Synchronisationsaufgabe Tw und andere Aufgaben To), die in jeder Prozedur oder Schleife 

involviertsind , . p 

Fig. 15 zeigt ein drittes Beispiel einer Ausfuhrungsprofdanzeige, bei der zwei Prozeduren # 1 und #2 in frorra 
einer Kreisgraphik wiedergegeben sind Kreisgraphiken eriauben im allgemeinen, daB der Anwender die Bezie- 
hung von Komponenten zu einer Gesamtheit einfacher vergleichen kann. Bei diesem dritten Anzeigeverfahren 
zeigt ein gesamter Kreis von 360 Grad die gesamte akkumulierte Ausfuhrungszeit einer Prozedur oder Schleife 
und vier Sektoren zeigen die Prozentsatze der Anwenderprogramm-Ausfuhnmgszeit (Ttt), der Kommumka- 
tionsaufgabe-Ausf Qhrungszeit (Tc), der Synchronisationsauf gabe-Ausfuhrungszeit (Tw) und der anderen Aufga- 
be-Ausfuhrungszeit (To) an. 

Fig. 16 zeigt ein viertes Beispiel einer Ausfuhrungsprofilanzeige, bei der das Ausfuhrungsproftl in Form einer 
Radarkarte wiedergegeben ist Die Radarkarte in Fig. 16 besitzt vier Achsen entsprechend den vier Programm- 
komponentea Die akkumulierten Ausfuhrungszeitwerte (Tu, Tc Tw und To) der Programmkomponenten sind 
auf deren jeweiligen Achsen aufgetragen und die aufgetragenen Punkte sind raiteinander verbunden, urn ein 
Polygon zu bilden, Aus der Gestalt dieses Polygons kann der Anwender intuitiv die Eigenschaften der Prozedur 
oder Schleife verstehen, die in einer Radarkarte proHiert sind. 

Ahnlich den anderen Anzeigeverfahren, die soweit beschrieben wurden, umfaBt die Radarkarte, die in Fig. 16 
veranschaulicht ist Informationen hinsichtlich der Minimal- und Maximalwerte und der Standardabweichung 
der akkumulierten Ausfuhrungszeit Dieses Merkmal ermoglicht es dem Anwender, das Verhalten jeder Pro- 
graramkomponente in einera detaillierteren Wert zu verstehen. ^ 

Fig. 17 zeigt ein funftes Beispiel einer Ausfuhrungsprofilanzeige geraaB der vorliegenden Erfindung. Ein 
Ausfuhrungsprofilfenster 50 besteht aus vier Abschnitten 50a bis 50d Der erste Abschnitt 50a enthalt die 
Legende der Balkengraphiken, die in den anderen Abschnitten des Fensters 50 dargestellt sind Spezieller gesagt, 
definiert die Legende die Farbklassifizierung for vier verschiedene Programmkomponenten, die bezeichnet sind 
rait: 

Anwender: Anwenderprogramm. 
Com: Kommunikationsaufgabe-Routine. 
Sync: Synchronisationsauf gabe-Routine. 

Runlib und Gop: andere Routinen. m 

Das Ausfuhrungsprofilfenster 50 bei dem funften Beispiel verwendet diese Farbklassifizierung zusammen rait 
dem Darstellungsverf ahren wie in Fig. 13. 4 „ , 

Der zweite Abschnitt 50b des Ausfuhrungsprofilfensters 50 zeigt ein prozedur-gestutztes Ausfunrungpro^ 
welches die akkumulierten Ausfuhrungszeiten von mehreren Prozeduren, wie beispielsweise "MAIN", "cald", 
ff calc2 w , w cputim ff und^nitaL^aufsunlmie^t > 

Der dritte Abschnitt 50c des Ausfuhrungsprofilfensters 50 zeigt ein fang-gestQtztes (caller-based) Ausfun- 
ningsprofU, welches die akkumulierte Ausfuhrungszeit von jeder Prozedur zusammen mh dem Namen yon 
dessen Fang-Routine (caller routine) zusammenfaBt Beispielsweise liest sich die oberste Zeile dieses Abschnitts 
wie folgt: 

calcl < 10292s > MAIN < UNSPECIFIED 

worin das links bezeichnete "fcalcl" der Name der Prozedur ist, die durch eine Fang-Routine "MAIN* gerufen 
wurde. Das am weitesten rechts gelegene Zeichen" < UNSPECIFIED* bedeutet, daB die Fang-Routine nicht 
ihren eigenen Programmnamen deklariert und der inharente Name "MAIN* durch das Analysierersystem 
verwendet wird Die Zeile zeigt auch an, daB die akkumulierte Ausfuhrungszeit dieser Prozedur "calcl" gleich 
1032 Sekunden betragt n . 

Die Balkengraphik fur diese "calcr-Prozedur ist farb-klassinziert geraaB der Legende, die in dem ersten 
Abschnitt 50a definiert ist, wobei vier Teile der Balkengraphik jeweils die akkumulierten Ausfuhrungszeiten Tu, 
Tc, Tw und To zeigt, und zwar zusammen mit der Anzeige des Minimums, Maximums und der Standardabwei- 

Der vierte Abschnitt 50d des Ausfuhrungsprofilfensters 50 zeigt ein rufer-gestiitztes AusfuhrungsprofiL 
Beispielsweise liest sich die oberste Zeile des Abschnitts 50d wie folgt: 

MAIN < UNSPECIFIED inital 

worin die Angabe "MAIN < UNSPECIFIED* den Namen einer Rufer-Routine zeigt und die andere Aufschrift 
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"initaT den Naraen einer gerufenen Prozedur anzeigt Die Balkengraphik fflr diese InitaF-Prozedur ist farb-klas- 
sifiziert gemaB der in dera ersten Abschnitt 50a definierten Legende. Sic besteht aus vier Teilen, die jeweils die 
akkumulierten Ausfuhrungszeiten Tu, Tc, Tw und To als auch deren Minimum- und Maximumwerte und 
Standardabweichung mit den zuvor erwahnten Symbolen zeigen. 

Fig. 18 zeigte ein sechstes Beispiel der Ausfuhrungsprofildarstellung gemaB der vorliegenden Erfindung. Ein s 
Ausfuhrungsprofilfenster 60 besteht aus vier Abschnitten 60a bis 60d Der erste Abschnitt 60a liefert die 
Legende von Balkengraphiken, die in den anderen Abschnitten des Fensters 60 dargestellt werden und spezieller 
definiert ist die Farbklassifikation fur vier Programrakomponent en, die bezeichnet sind mit: 
Anwender: Anwenderprogramm. 

Com: Komraunikationsaufgabe-Routine. to 
Sync: Synchronisationsaufgabe- Routine. 
Runlib und Gop: andere Routinen. 

Die Legende umfaBt aucb die Farbklassifizierung fur Verzweigungsbedingungen, die enthalt "Wahr*- und 
"Falsch"-Bedingungen fur logische Operationen und "negative", "Null-" und "positive" Bedingungen fur arithmeti- 
sche Operationen. is 

Der zweite Abschnitt 60b des Ausfuhrungsprofilfensters 60 zeigt ein Ausfuhrungsprofil, welches die akkumu- 
lierten Ausfuhrungszeiten fur mehrere Schleifen zusamraenfaBL 

Der dritte Abschnitt 60c des Ausfuhrungsprofilfensters 50 zeigt ein Ausfuhrungsprofil welches die Verzwei- 
gungsbedingungen zusamraenfaBt Die obere Balkengraphik in dem dritten Abschnitt 60c veranschaulicht die 
Prozentsatze von "Wahr"-Bedingungen und "Falsch"-Bedingungen, die tatsachlich als ein Ergebnis der logischen 20 
Operationen aufgetreten sind. Die hintere Balkengraphik veranschaulicht die Prozentsatze von "positiven", 
"Null-" und "negativen" Bedingungen, die tatsachlich als ein Ergebnis der arithmetischeo Operationen aufgetre- 
ten sind 

Der viene Abschnitt I6d des Ausfuhrungsprofilfensters 60 liefert ein gerufenen-gesttitztes (caller-based) 
Ausfuhrungsprofil, welches das gleiche ist wie bei dem dritten Abschnitt 50c in Fig. 17. 25 

Zusammenfassend fur die Fig. 12 bis 17 gibt die vorliegende Ausfuhrungsform die Ergebnisse der Leistungs- 
analyse wieder, und zwar unter Verwendung einer Vielfalt von Darstellungsverfahrea Neben der Moglichkeit, 
die mittlere Ausfuhrungszeit von jeder Subjekt- Routine darstellen zu konnen, zeigt das vorliegende Analysierer- 
system die Maximum-, Minimum- und Standardabweichung der Ausfuhrungszeiten, wodurch der Anwender die 
Mdglichkeit erhak, mit einem Blick zu erkennen, wie die Prozentsatze tatsachlich schwanken. 30 

Bei der vorliegenden Ausfuhrungsform analysiert das Leistungsanalysierersystem das Parallelrechnersystem 
1 1 (siehe Fig. 1), welches aus vielfachen Prozessoren # 1 bis # n besteht Jedoch kann die vorliegende Erfindung 
auch auf ein einzelnes Prozessorsystem angewandt werden, welches vielfache Aufgaben ausfuhrt, und zwar 
durch Verwendung eines Zeitteilungsverfahrens. In diesem Fall sammeln mehrere geeignete Laufzeit-Subrouti- 
nen Ausfuhrangsdaten fur einzelne Prozesse oder Module, welche virtuell parallel laufen und das Leistungsana- 35 
lysierersystera summiert die gesamraelten Daten auf und stellt die Ergebnisse als Ausfuhrungsprofile dar. Wie 
bei der vorliegenden Ausfuhrungsform zeigt das Ausfuhrungsprofil, welches auf einem Bildschinn dargestellt 
wird, mittlere. Minimum* und Maximum-Ausf uhrungszeiten und die Standardabweichung von dem Mittefwert 
hinsichtlich der Subjektprozesse oder Module. 

Die vorangegangene Beschreibung dient lediglich der Veranschaulichung der Prinzipien der vorliegenden 40 
Erfindung. Da ferner vielf altige Modiflkauonen und Anderungen fur den Fachmann offensichtlich sind, ist nicht 
beabsichtigt, die Erfindung auf die exakte Konstruktion und Anwendungen zu beschranken, die beschrieben 
wurden, und demzufolge fallen alle geeigneten Modifikationenjind Hquivalenten Ausfuhrungen in den Rahmen 
der Erfindung gemaB den anhangenden AnsprQchen und deren Aquivalente. 

45 

Patentanspruche 

1. Verfahren zur sichtbaren Darstellung von Ergebnissen einer LeistungsQberwachung und -analyse fur ein 
Parallelrechnersystem, bei dem eine Vielzahl von Prozessoren ein parallel verarbeitendes Programm aus- 
fuhren, welches aus einer Vielzahl von Routinen zusammengesetzt ist wobei das Verfahren die folgenden so 
Schritte umfaBt: 

(a) Sammeln von Informationen hinsichtlich der Ausfuhrungszeit von jeder Routine, die gleichiaufend 
durch eine Vielzahl von Prozessoren ausgefuhrt wird, unter Berucksichtigung der Klassifizierung der 
Routinen; 

(b) Ableiten eines Maximalwertes, eines Mittelwertes, eines Minimalwertes und einer Standardabwei- 55 
chung der Ausfuhrungszeit von jeder Routine basierend auf den Informationen, die fur die Vielzahl der 
Prozessoren gesammelt wurden; und 

(c) graphisches Darstellen der Ausfuhningsprofil-Inforraation, welche den Maximalwert, den Mittel- 
wert und den Minimalwert und die Standardabweichung der Ausfuhrungszeit jeder Routine enthalt 

Z Verfahren nach Anspruch I, bei dem bei dem Schritt (a) die Ausfuhrungszeit von jeder Routine akkumu- bo 
liert wird, jedesmal, wenn die Routine aufgerufen und ausgefuhrt wird 

3. Verfahren nach Anspruch 1, bei dem bei dem Schritt (a) die Ausfuhrungszeit von jeder Routine gesam- 
melt wird, die als ein Subjekt der Profilierung bezeichnet wurde. 

4. Verfahren nach Anspruch 1, bei dem bei dem Schritt (a) die Routinen in ein Anwenderprogramm, 
Kommunikationsaufgaben, Synchronisationsaufgaben und andere Aufgaben klassifiziert werden. 65 

5. Verfahren nach Anspruch 3, bei dem das Subjekt der Profilierung Prozeduren, Schleifen und parallel 
verarbeitende Bibliotheksroutinen enthalt 

6. Verfahren nach Anspruch 1 , bei dem bei dem Schritt (b) ferner die Standardabweichung der AusfQhrungs- 



9 



zeit von jeder Routine zusatzlich zu dem Maximarwert, dem Mittelwert und dem Minimalwert berechnet 
wird. 

7. Verfahren nach Anspruch 1, bei dero bei dem Schritt (c) Rufer-Routinen und/oder Gerufener-Routinen 
aus den Routinen in dem parallel verarbeitenden Programm extrahiert werden und die AusfGhrungsprofil- 
information, welche zu den extrahierten Routinen gehort, dargestellt wind. 

8. Verfahren nach Anspruch 1 , bei dem bei dem Schritt (c) eine Balkengraphik verwendet wird, urn graphiscb 
die Ausfuhrungsprofilinformation von jeder Routine darzustellea 

9. Verfahren nach Anspruch t, bei dem bei dem Schritt (c) eine Kreisgraphik verwendet wird, urn graphisch 
die Ausfuhrungsprofilinfonnation von jeder Routine darzustellea 

10. Verfahren nach Anspruch 1, bei dem bei dem Schritt (c) eine Radarkarte verwendet wird, um die 
Ausf uhrungsprofdinformation von jeder Routine graphisch darzustellea 

1 1. Verfahren nach Anspruch 1, welches ferner die folgenden Schritte umfaBt: 

(d) Annehmen einer Bezeichnung eines Punktes der Ausfuhrungsprofilinformation, die bei dem Schritt 
(c) dargestellt wird, und 

(e) Darstellen eines Teiles des Quellencodes des parallel verarbeitenden Programms, welches dem 
bezeichneten Punkt der Ausfuhrungsprofilinfonnation entspricht 

12. Ein computer-lesbares Medium, welches mit einem Computer-Programm codiert ist, bei dem das 
Verfahren nach Anspruch 1 implementiert ist 

Hierzu 18 Seite(n) Zeichnungen 
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